iT邦幫忙

2024 iThome 鐵人賽

DAY 13
0
自我挑戰組

金融資料科學系列 第 13

投資組合管理 - 金融科技

  • 分享至 

  • xImage
  •  

金融科技與大數據

「金融科技」是金融服務和產品的技術創新。
這包括大數據、人工智慧和機器學習在金融領域的應用。

金融科技始於日常任務的自動化,但現已發展為基於機器學習邏輯的決策應用程式。

金融科技的關鍵領域包括:

  • 分析大型資料集,例如來自社群媒體和感測器網路的資料集
  • 分析工具,包括人工智慧技術
  • 自動交易,這可以帶來更有效率和匿名的交易
  • 自動化建議,稱為“機器人顧問”,比傳統顧問便宜。
  • 使用“分散式帳本技術(DLT)”等方式保存財務記錄,從而減少對金融中介機構的需求。

數據集的規模和多樣性都在不斷增長。
大數據包括傳統數據(例如證券交易所和政府)和另類數據(包括社交媒體和感測器網路)。

大數據資料集具有數量大、速度快、多樣性的特性。
資料量已從兆位元組成長到拍字節。
高速度是可能的,因為現在可以即時取得更多數據。
大數據的多樣性包括來自社群媒體、電子郵件和簡訊等來源的非結構化資料。

大數據來源

大數據來源包括:

  • 金融市場
  • 企業(如公司財務)
  • 政府(例如貿易和經濟數據)
  • 個人(例如信用卡購買、網路搜尋日誌和社交媒體貼文)
  • 感測器(例如衛星圖像和交通模式)
  • 物聯網(例如,來自「智慧」建築的資料)

替代資料的三個主要來源是由個人、業務流程和感測器產生的。

來自個人的資料通常是非結構化的,格式為文字、影片、照片和音訊。
隨著個人透過電子蹤跡參與更多活動(例如社群媒體和網路搜尋),可以獲得更多資料。

業務流程資料更加結構化。
它們包含來自直接銷售和「企業廢氣」的數據,其中包括供應鏈資訊和銀行記錄。
零售銷售點掃描器資料是業務流程產生的企業廢氣的一個範例,用於提供業務績效的即時指示。

智慧型手機和衛星等設備上的感測器是最大的數據來源。
感測器資料包括稱為物聯網的網路佈置。
這些網路允許系統中的物件(例如建築物、電器、車輛)進行互動和共享資訊。

另類資料用於識別影響證券價格的因素,然後可用於改善資產選擇和交易。
但投資專業人士在收集受法規保護的個人資訊時應謹慎。

大數據

大數據的挑戰包括品質、數量和適當性
資料集可能存在偏差或存在異常值。
在使用資料集之前,必須對其進行獲取、清理和組織。
人工智慧和機器學習技術被用來對這些複雜的資訊進行分類。

人工智慧與機器學習

人工智慧 (AI) 使電腦能夠執行傳統上需要人類智慧才能完成的任務。
自 1980 年代以來,金融機構一直在使用人工智慧,首先是用於檢測信用卡詐欺的神經網路。

機器學習 (ML) 演算法是學習如何完成任務的電腦程序,並隨著更多資料的出現而不斷改進。
機器學習模型經過訓練可以映射輸入和輸出之間的關係。
訓練資料集用於建立模型,其他資料集用於驗證模型。
演算法沒有明確編程,這可能會導致結果不容易理解。

需要人工判斷來確保數據品質。
潛在的錯誤包括過度擬合,當機器學習模型對輸入和目標資料集學習良好時就會發生這種情況。
過度擬合可能會導致 ML 模型將資料中的雜訊視為真實參數。
欠擬合可能會導致 ML 模型將真實參數視為雜訊。
這些模型可能過於簡單。

機器學習

機器學習包括「監督學習」和「無監督學習」。

在監督式學習中,電腦從標記的訓練資料中學習。
識別演算法的輸入和輸出。
這種方法可用於確定預測未來股票報酬的最佳變數。

在無監督學習中,僅向演算法提供資料集。
輸入和輸出未標記。
這可用於將公司分為同等組。

深度學習利用神經網路以多階段方法辨識模式。
這導致對簡單概念的理解,這些概念可用於創建更複雜的概念。
這些演算法用於圖像和語音識別等應用。

資料科學

數據科學利用電腦科學和統計學從數據中提取資訊。

資料處理方法

「資料擷取」-收集資料並將其轉換為可用的格式。
低延遲系統以最小的延遲傳輸大量數據,這是自動交易所需的。

資料管理 – 清理資料以確保高品質。
資料儲存 – 記錄、存檔和存取資料。
搜尋 – 在大型資料集中尋找特定資訊。
傳輸 – 將資料從來源或儲存位置移至分析工具。

資料視覺化

資料視覺化是以圖形形式顯示和總結資料的方式。
通常需要“多維分析”,這可以透過向 3D 圖表添加顏色和形狀來完成。
標籤雲可用於顯示資料中關鍵字的頻率。
出現頻率較高的單字採用較大的字型。

資料科學中使用的常見程式語言包括 Python、R。
使用的資料庫包括 SQL 和 NoSQL。

文本分析

文字分析使用電腦程式來分析非結構化文字或基於語音的資料集。
這可能來自公司文件、社群媒體和電子郵件等數據。
這些方法可用於識別市場走勢的預測因子。

自然語言處理

自然語言處理(NLP)則專注於解釋人類語言。
這用於翻譯和語音識別應用程式。
它也可用於監控員工之間的通信,以確保遵守政策。

NLP 可用於監控比人類所能監控的更多的報告和財報電話會議。
例如,NLP 可用於監控分析師有關投資建議的評論。
這可以用來推斷報告中的情緒,這可能會導致稍後的評級變化。

機器人諮詢服務

機器人建議是根據客戶的數據提供的,包括他們對風險承受能力調查問卷的回答。
提供的服務範圍從資產配置到稅務損失收穫。
大多數建議都採用被動投資方法,為客戶創造了一個成本非常低的替代方案。

機器人投顧常見兩種類型的財富管理服務。

  • 全自動數位財富管理機構:它們提供了低成本的解決方案,通常建議混合使用交易所交易基金。
  • 顧問輔助的數位財富經理:虛擬財務顧問可以透過電話提供基本的規劃建議,克服機器人顧問的一些限制。

機器人顧問對於財富較少、無力聘請個人顧問的投資者來說非常有用。
但客戶可能不信任機器人顧問做出所有決定。
機器人顧問可能無法正確解決複雜的情況。

風險分析

監管機構要求投資公司進行壓力測試和風險評估。
為了即時監控市場活動,監管機構必須分析大量數據,包括定量和定性風險數據。
機器學習技術可用於分析資料品質。
投資組合風險管理可以透過「場景分析」來完成,這需要大量的計算。

演算法交易

演算法交易是根據預先定義的規則自動進行金融工具交易。
它通常用於將非常大的訂單分成較小的部分。
這種類型的交易提高了執行速度並提供了更多的匿名性。
演算法交易策略可以使用「限價訂單」來執行,以確定最高購買價格/最低銷售價格,也可以使用採用現行市場價格的市價訂單來執行。

「高頻交易(HFT)」是一種在不到一秒的時間內發生的演算法交易。
這種交易旨在從盤中市場錯誤定價中獲利。

分散式帳本技術

「分散式帳本技術(DLT)」可用於改善財務記錄保存。
資產的所有權是在點對點的基礎上創建和交換的。
DTL 可以提高準確性和透明度。
然而,由於該技術尚未完全安全,人們擔心可能會侵犯隱私。
此外,DTL 需要大量的運算能力來驗證交易。

分散式帳本由網路中的實體共用。
每個參與者都有一個匹配的數位資料庫副本。
共識機制用於確保所有參與者就帳本的共同狀態達成一致。
交易在發生時進行驗證,分類帳也會隨之更新。
DTL 網路使用「密碼學」來驗證參與者並加密數據,以使未經授權的各方無法使用它們。

可以使用 DLT 創建“智能合約”。
這些合約是電腦程序,如果滿足預先指定的條款,則將執行這些合約。
例如,如果發生違約,抵押品可能會自動轉移。

區塊鏈是一種數位分類賬,其中資訊按順序記錄在使用密碼學連結(即連結)的區塊內。
新交易只有在經過共識機制驗證後才會加入。
更新區塊鏈的過程需要大量的運算能力,這使得操縱歷史資料變得困難。
這些網路需要廣泛的參與,因此沒有任何一個實體可以控制大多數「節點」。

授權與非授權網路

「無許可網路」允許任何使用者進行交易。
所有用戶都可以看到區塊鏈上存在的交易。
不需要集中機構來驗證交易。
由於每個節點都儲存資料庫的副本,因此無法變更。
比特幣是開放、無需許可的網路的一個例子。

「許可網路」可以限製成員參與某些活動。
例如,網路可能允許某些參與者新增交易,而監管機構僅被授權查看交易資料。

分散式帳本技術在投資管理的應用

加密貨幣

加密貨幣是一種電子貨幣,允許各方之間進行交易而無需銀行等中介機構。
大多數加密貨幣使用開放的 DLT 系統。
由於幾種加密貨幣經歷了高波動性,它們作為價值儲存手段的有效性已經減弱。
由於缺乏明確的基本面,許多加密貨幣經歷了高度波動。

公司利用「首次代幣發行(ICO)」來籌集資金。
加密代幣出售給投資者,投資者可以用它們購買發行人的未來產品。
目前,ICO 不受監管,這對於尋求快速籌集資金的公司來說,與傳統的首次公開募股相比具有吸引力。
ICO 不受監管,這大大降低了發行成本。

交易後清算結算

金融中介機構確認、清算和結算金融證券市場的交易。
DLT 可以透過近乎即時的交易驗證和對帳來簡化這一過程。
這將減少對第三方協助的需求。
速度的提高將降低交易對手的風險。

合規性

監管機構要求更多的報告和透明度。
透過為監管機構和公司提供對所有交易的近實時審查,DLT 可以潛在地提高準確性和透明度。


上一篇
投資組合管理 - 技術分析
下一篇
固定收益
系列文
金融資料科學30
圖片
  直播研討會
圖片
{{ item.channelVendor }} {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

尚未有邦友留言

立即登入留言